文件读取与存储

1> CSV 文件

① read_csv

pandas.read_csv(filepath_or_buffer, sep =',', usecols )

参数 说明
filepath_or_buffer 文件路径
sep 分隔符,默认用","隔开
usecols 指定读取的列名,列表形式
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])

            open    close
2018-02-27    23.53    24.16
2018-02-26    22.80    23.53
2018-02-23    22.88    22.82
2018-02-22    22.25    22.28
2018-02-14    21.49    21.92

② to_csv

DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)

参数 说明
path_or_buf 文件路径
sep 分隔符,默认用","隔开
columns 选择需要的列索引
header boolean or list of string, default True,是否写进列索引值
index 是否导出索引
mode 'w':重写, 'a' 追加
# 选取10行数据保存,便于观察数据
data[:10].to_csv("./data/test.csv", columns=['open'])

2> HDF5

HDF5文件的读取和存储需要指定一个键,值为要存储的DataFrame;

需要安装tables模块避免不能读取HDF5文件 : pip install tables

pandas.read_hdf(path_or_buf,key =None,** kwargs)

参数 说明
path_or_buf 文件路径
key 读取的键
# 读取文件
day_close = pd.read_hdf("./data/day_close.h5", key="day_close")

# 存储数据
day_close.to_hdf("./data/test.h5", key="day_close")